Research in Computing Science, Vol. 47, pp. 159-180, 2012.
Abstract: El aprendizaje de preferencias de argumentos de verbos usualmente se ha tratado como un problema de verbo y argumento, o a lo mucho como una relación trinaria entre sujeto, verbo y objeto. Sin embargo, la correlación simultánea de todos los argumentos en una oración no ha sido explorado a profundidad para la medida de plausibilidad de una oración debido al alto número de combinaciones potenciales de argumentos, así como a la dispersión de los datos. En este trabajo presentamos una revisión de algunos métodos comunes para aprender las preferencias de los argumentos, comenzando con el caso más simple que considera correlaciones binarias, después lo comparamos con correlaciones trinarias, y finalmente consideramos todos los argumentos. Para esto último, usamos un modelo de aprendizaje en conjunto (ensemble learning) mediante modelos discriminativos y generativos; mediante características de coocurrencia y características semánticas en distintos arreglos. Buscamos responder preguntas acerca del número óptimo de tópicos requeridos para los modelos de PLSI y LDA, así como el número de coocurrencias que se requiere para mejorar el desempeño. Exploramos las implicaciones de usar diversas formas de proyectar correlaciones, es decir, en un espacio de palabras, o directamente en un espacio de coocurrencia de características. Realizamos pruebas para una tarea de pseudodesambiguación aprendiendo de corpus muy grandes extraídos de Internet.
Keywords: Aprendizaje automático, argumentos verbales completos, corpus
PDF: Aprendizaje de argumentos verbales completos y su plausibilidad en oraciones a partir de corpus
PDF: Aprendizaje de argumentos verbales completos y su plausibilidad en oraciones a partir de corpus